期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 带状稀疏矩阵乘法及高效GPU实现
刘丽, 陈长波
《计算机应用》唯一官方网站    2023, 43 (12): 3856-3867.   DOI: 10.11772/j.issn.1001-9081.2022111720
摘要226)   HTML3)    PDF (3222KB)(194)    收藏

稀疏-稠密矩阵乘法(SpMM)广泛应用于科学计算和深度学习等领域,提高它的效率具有重要意义。针对具有带状特征的一类稀疏矩阵,提出一种新的存储格式BRCV(Banded Row Column Value)以及基于此格式的SpMM算法和高效图形处理单元(GPU)实现。由于每个稀疏带可以包含多个稀疏块,所提格式可看成块稀疏矩阵格式的推广。相较于常用的CSR(Compressed Sparse Row)格式,BRCV格式通过避免稀疏带中列下标的冗余存储显著降低存储复杂度;同时,基于BRCV格式的SpMM的GPU实现通过同时复用稀疏和稠密矩阵的行更高效地利用GPU的共享内存,提升SpMM算法的计算效率。在两种不同GPU平台上针对随机生成的带状稀疏矩阵的实验结果显示,BRCV的性能不仅优于cuBLAS(CUDA Basic Linear Algebra Subroutines),也优于基于CSR和块稀疏两种不同格式的cuSPARSE。其中,相较于基于CSR格式的cuSPARSE,BRCV的最高加速比分别为6.20和4.77。此外,将新的实现应用于图神经网络(GNN)中的SpMM算子的加速。在实际应用数据集上的测试结果表明,BRCV的性能优于cuBLAS和基于CSR格式的cuSPARSE,且在大多数情况下优于基于块稀疏格式的cuSPARSE。其中,相较于基于CSR格式的cuSPARSE,BRCV的最高加速比为4.47。以上结果表明BRCV可以有效提升SpMM的效率。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于同态门限密码体制的投票协议
代小康, 陈长波, 吴文渊
计算机应用    2018, 38 (4): 1036-1040.   DOI: 10.11772/j.issn.1001-9081.2017102400
摘要405)      PDF (905KB)(427)    收藏
针对当前存在的投票协议普遍要求一个可信赖的管理机构的问题,提出一种新的投票协议。该协议综合运用同态加密、门限密码体制、盲签名、环签名、零知识证明等密码技术,在假设无人弃权或虽有人弃权但管理者不与其他投票人合谋作弊的情况下,消除了无可信第三方和健壮性共存的矛盾,同时满足了匿名性、合法性、健壮性、可验证性和无可信第三方等安全属性。
参考文献 | 相关文章 | 多维度评价
3. 有效保留模型特征的自适应分层算法
李文康, 陈长波, 吴文渊
计算机应用    2015, 35 (8): 2295-2300.   DOI: 10.11772/j.issn.1001-9081.2015.08.2295
摘要474)      PDF (941KB)(391)    收藏

针对3D打印中已有自适应分层算法不能有效保留模型特征的问题,提出了一种新的识别和保留模型特征的自适应分层算法。首先,扩展了模型特征的定义,引入了模型特征丢失和偏移的概念;然后,提出了一种特征识别的方法,其识别模型特征的关键在于利用了模型特征出现的地方必然伴随着模型表面复杂度或切片轮廓数的变化这一性质;最后,在已有自适应分层算法的基础上,通过在特征附近用最小的分层厚度处理模型来保留模型的特征。在自主开发的软件Slicer3DP上实现了均匀分层、自适应分层和所提的分层算法,对比发现所提算法能有效解决模型特征的丢失和偏移,兼顾了分层精度和效率。仿真表明该算法可以用于对模型精度要求较高的3D打印中。

参考文献 | 相关文章 | 多维度评价